1. MetaStep TOP
  2. ビジネス活用を学ぶ
  3. 【GPT-4o(omni)】ChatGPTの最新モデルがリリース!使える機能を図で解説

2024.05.21

【GPT-4o(omni)】ChatGPTの最新モデルがリリース!使える機能を図で解説

2024年5月にChatGPTの新モデルGPT-4o(omniオムニ)がリリースされました。音声会話の精度をアピールする動画が注目されていますが、その他の機能がどのように変わったのかわからない、という方もいるのではないでしょうか。

そこで今回はGPT-4oが以前のモデルから何ができるようになったのかを詳しく解説し、実際のプロンプトと生成結果も紹介します。

(過去に掲載したChatGPTの基礎知識【話題のGPT-4o! まずその前に】ChatGPTをやさしく解説:初心者でも使える対話型AIツールも是非併せてご覧ください。)

無料版で使えるようになった機能

GPT-4oは無料版でも利用でき、機能性が高まりました。これまで無料版で利用できたGPT-3.5との違いを表にまとめたので、参考にしてください。

これまで無料版では利用出来なかったファイルの読み込みやWeb検索機能、他のユーザーが作成したオリジナルのAIツールであるGPTsが使えるようになった点が大きな特徴です。

有料版に登録すれば利用制限が最大80回/3時間まで、上記機能のすべてが使えるようになります。

無料版のGPT-4oは連続10回使用するとすぐに利用制限に達してしまうため、現状ではあくまで体験版という位置づけだと考えておくと良いでしょう。

なお2024年5月20日現在、スマホアプリ版ではDynamicと呼ばれる、用途に応じて自動でモデルが切り替わるタイプが採用されているため、手動で切り替える必要はありません。

音声会話の反応速度が向上

GPT-4oにアップデートしたことで音声会話の反応速度が向上し、人間と話すように自然に会話できるようになりました。以下のOpenAIが公開するYouTube動画で、音声会話の様子が公開されているので参考にしてください。

ブラウザ版のChatGPTではまだ音声会話に対応していませんが、拡張機能をつかうことで音声でテキストを入力し、回答を読み上げる機能が利用できます。以前に公開した「ChatGPTを音声操作で使いこなそう!業務効率化や同時通訳に活用可能」記事で詳しく解説しているので参考にしてください。

画像解析精度が向上

これまでのGPT-4でも画像を認識してテキストを生成する機能がありましたが、GPT-4oではその解析精度が向上しています。たとえば、手書きで雑に書いたWebサイトのイメージを認識し、HTML、CSSのコードを生成することができます。

実際にPCのペイントツールで手書きした以下の画像をGPT-4oに読み込ませ、コードを生成してみました。

プロンプト
添付した画像のイメージでWebサイトを作りたいです。HTMLとCSSのコードを生成してください。
全体的にベージュを基調とした落ち着いた雰囲気でお願いします。

GPT-4oが生成したコードを元にWebサイトにしてみたところ、以下のような結果となりました。

※画像はフリー素材を入れています。

イラストの通り正しく意図が伝わり、画像を設置するためのHTMLまで生成されました。指定された画像名で同じファイルに保存すればこのように画像がWebサイトに反映されます。

GPT-4でも同じようにHTML、CSSを生成できますが、GPT-4oほど高性能ではありません。

同じ画像を読み込ませてコードを生成し、作成できたWebサイトは以下の通りです。

ロゴやmenuが反映されておらず、「画像」と書いた場所が画像を設置する場所だということを理解できていません。

このように、GPT-4oは簡単な画像からでも、プロンプト(AIへの指示文)の内容からその意図を読み取れることがわかります。コードの生成スピードも高速なことから、実際のWebサイトを作成する際のたたき台作りに活用できそうです。

API料金が安価に

GPT-4oにアップデートされたことで、トークン(テキストデータを分割する最小単位)の消費数が減少。英語のトークンは1.1分の1、日本語は1.4分の1まで減少しています

それに伴い、API(外部のソフトウェアから接続する機能)の料金が安価になりました。APIを使用すると定額の課金制ではなく、使用したトークン数に応じて費用がかかります。

そのため、すでにビジネス分野で頻繁にChatGPTを使用している方はコストが抑えられるのです。

まとめ

今回紹介したGPT-4oはまだすべての機能が公開されているわけではありません。ところが、OpenAIが公開していないSTLファイルの生成に成功したユーザーが現れ、注目を集めました。

「STLファイルを生成してください」とプロンプトを入力するとPythonコードが生成される仕組みです。開発環境の整った状態でそのコードを実行すると、STLファイルが生成されます。

OpenAIが今後発表する予定だったかどうかは不明ですが、今後、ユーザーの使い方次第でGPT-4oの新しい機能や、思わぬ使い方が発見される可能性があります。すでにGPT-4oの新機能だけでも活用の幅が広いうえ、どこまで広がっていくことでしょう・・・。

MetaStepでもGPT-4oの新機能について今後取り上げていく予定です。次回は「音声会話」の方法について掲載します。どうぞお楽しみに。